新 世纪 20 年 国内 结构 方程 模型 
万 法 研究 与 模型 发 展 * 
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(2020GXJK342) 的 资助 。 


H o 
K 1 2001~2020 年 国内 (期 刊 ) 各 学 科 发 表 SEM 方法 论文 的 频数 分 布 ( 按 发 文 篇 数 排序 ) 
刊物 类 别 合计 
2001~2005 2006~2010 2011~2015 2016~2020 

心理 学 5 12 28 25 70 
医学 2 12 14 12 40 
统计 学 5 13 12 3 33 
其 它 学 科 2 8 11 10 31 
综合 性 刊物 4 5 3 6 18 
合计 18 50 68 56 192 


注 : 其 它 学 科 包 括 系统 科学 (7 篇 )、 管 理学 (6 篇 )、 数 学 (4 篇 )、 体 育 学 (3 篇 )、 信 息 学 (3 篇 )、 教 育 学 (3 篇 )、 


社会 学 (2 篇 )、 生 物 学 (1 篇 )、 计 算 机 科学 (1 篇 ) 和 语言 学 (1 篇 )。 综 合 性 刊物 主要 是 高 校 学 报 。 图 中 涉及 卉 


= 于 SEM 的 信 度 计算 和 中 介 调 节 方 法 论文 29 篇 , 由 于 这 些 文章 男 有 专文 综述 (见方 杰 等 , 2022; ER, TA, 


ks 谢晋 艳 等 , 2022; HARI, JA, 陈 虹 嘉 等 , 2022)， 这 里 只 做 篇 数 统计 ， 正 文 未 出 现 。 
从 学 科 来 看 ， 多 达 13 个 学 科 发 表 过 SEM 方法 研究 ， 其 中 心理 学 发 文 最 多 ， 其 次 是 医 


学 和 统计 学 。 从 出 版 时 间 来 看 , 2001~2005 年 18 篇 , 2006~2010 年 50 篇 , 2011~2015 年 68 篇 ， 


2016~2020 年 56 篇 。SEM 方法 学 研究 总 体 上 呈 上 升 趋势 ，2011~2015 年 是 高 峰 期 。 这 与 
内 心理 统计 方法 研究 发 展 趋势 一 致 ( 温 忠 麟 等 , 2021)。 

根据 内 容 所 涉及 的 SEM 研究 主题 对 文章 进行 分 类 。 有 10 篇 以 上 文章 讨论 同一 主题 的 
归 为 一 类 ， 否 则 归 为 “其 它 ” 类 。 这 样 ， 国 内 (期 刊 ) 的 SEM 方法 学 研究 论文 可 以 分 为 5 个 主 
题 : 模型 发 展 (69 篇 )、 参 数 估计 (38 篇 )、 模 型 评价 (17 篇 )、 测 量 不 变性 (15 篇 )、 特 殊 数 据 处 


一 理 (10 篇 )， 还 有 其 它 43 篇 。 这 与 温 忠 麟 等 (2021) 对 SEM 研究 主题 的 分 类 略 有 出 入 ， 因 为 本 


文 不 限于 心理 学 期 刊 发 表 的 论文 。 本 文 总 结 新 世纪 20 年 (2001~2020 年 ) 国 内 (期 刊 )SEM 方法 


研究 进展 ， 并 通过 对 比 近 年 来 国外 SEM 方法 研究 ， 了 解 该 领域 一 些 前 沿 论题 。 


2 结构 方程 模型 的 发 展 

结构 方程 模型 包含 测量 模型 (measurement model) 和 结构 模型 (structural model). 测量 模型 
反映 潜 变 量 及 其 测量 指标 的 关系 , 单独 使 用 即 为 验证 性 因子 分 析 (confirmatory factor analysis, 
CFA); 结构 模型 反映 ( 潜 ) 变 量 间 的 影响 关系 ， 如 果 结 构 模 型 中 的 潜 变 量 换 成 测量 指标 的 均 分 
或 总 分 进行 分 析 ， 就 是 路 径 分 析 (path analysis)。 近 年 来 ，SEM 发 展 出 不 少 新 变 式 ， 测 量 模 
型 方面 主要 有 双 因 子 模型 、 探 索性 结构 方程 模型 、 特 殊 设 计 的 测量 模型 (随机 截 距 因子 分 析 
模型 、 预 设 路 径 模型 及 瑟 斯 顿 模型 ) 和 形成 性 测量 模型 ， 而 结构 模型 方面 主要 是 主客 体 互 依 
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模型 ， 全 模型 方面 ( 即 同 时 包含 测量 和 结构 模型 的 完整 SEM) 主 要 是 测量 指标 合并 ( 即 条 目 打 
包 ) 的 SEM。 此 外 ，SEM 在 群体 异 质 性 研究 和 追踪 研究 中 的 发 展 也 值得 关注 。 
2.1 测量 模型 的 发 展 
2.1.1 双 因 子 模型 
传统 CFA 中 ， 一 个 问卷 条 目 只 在 一 个 因子 上 有 非 零 载 荷 。 双 因子 模型 (bifactor model) 
则 在 一 般 多 因子 CFA 模型 基础 上 , 允许 问卷 条 目 额外 负载 于 一 个 全 局 因子 ( 顾 红 磊 等 , 2014)， 
全 局 因子 可 以 是 特质 因子 (可 用 于 探索 和 验证 高 阶 因子 结构 、 计 算 基于 CFA 模型 的 信 度 及 分 
析 各 类 因子 与 效 标 变量 的 关系 ) 或 方法 因子 (可 用 于 检验 共同 方法 偏差 )。 
双 因 子 模型 和 高 阶 因 子 模型 有 嵌 套 关系 , 任何 一 个 高 阶 因 子 模型 都 可 以 转换 为 一 个 双 因 
子 模型 ， 但 只 有 满足 比例 约束 ( 即 每 个 维度 中 全 局 因子 载荷 和 局 部 因子 载荷 之 比 为 常数 ) 的 双 
> 因子 模型 才能 转换 为 一 个 高 阶 因子 模型 ( 顾 红 磊 等 , 2014) 。 模 拟 研究 发 现 ， 对 于 满足 比例 约 
束 的 特殊 双 因 子 模型 ， 其 对 潜 效 标 变量 的 预测 精度 不 如 高 阶 因 子 模型 ( 徐 箱 雪 等 , 2017); 而 
在 不 满足 比例 约束 的 更 一 般 情况 下 ,使 用 双 因 子 模型 进行 预测 效 度 分 析 时 ,模型 拟 合 、 统 计 
检验 力 和 效 度 系数 估计 精度 优 于 高 阶 因 子 模型 ( 温 忠 腾 等 , 2019)。 
2.1.2 探索 性 结构 方程 模型 
传统 CFA 模型 是 典型 的 独立 分 群 模型 ， 问 卷 条 目 在 非 目 标 因 子 上 载荷 固定 为 0， 这 可 
能 造成 因子 间 相关 虚 高 ， 也 容易 使 CFA 拟 合 不 了 探索 性 因子 分 析 得 到 的 因子 结构 。 探 索性 
结构 方程 模型 (exploratory structural equation modeling, ESEM) 可 以 有 效 弥 补 这 些 局 限 , ESEM 
在 CFA 的 基础 上 ， 人 允许 跨 因 子 载荷 不 为 0。 更 真实 地 体现 因子 结构 的 同时 ， 还 容易 获得 较 
好 的 拟 合 。 麦 玉 娇 和 温 上 忠 腾 (2013) 详 细 介 绍 了 ESEM 的 原理 , 比较 了 ESEM 和 探索 性 因子 分 
析 、CFA 的 异同 点 ， 并 给 出 了 使 用 ESEM 的 建议 。 值 得 一 提 的 是 ， 如 果 模 型 参数 估计 采用 
贝 叶 斯 法 并 设 定 特殊 先 验 ， 则 不 仅 能 像 ESEM 一 样 放宽 跨 因 子 载荷 限制 ， 还 能 更 灵活 地 放 
宽 残 差 相关 限制 (Muthkn & Asparouhov, 2012). 
2.1.3 特殊 设计 的 测量 模型 
随机 截 距 因子 分 析 模 型 。 随 机 截 距 因子 分 析 模 型 (random intercept factor analysis model) 
在 一 般 CFA 模型 的 基础 上 ， 增 加 一 个 潜 截 距 因 子 。 潜 截 距 因 子 取 值 在 被 试 间 有 变异 ， 在 条 
目 间 无 变异 ( 即 潜 截 距 因 子 在 所 有 条 目 上 载荷 固定 为 常数 ), 以 此 反映 被 试 的 某 种 稳定 特质 (如 
社会 赞许 性 或 默许 偏差 )， 可 以 用 于 解释 和 控制 条 目 表述 效应 。 研 究 发 现 ， 相 比 于 双 因 子 模 
型 , 随机 截 距 因子 分 析 模 型 有 助 于 提升 特质 变异 在 问卷 分 数 总 变异 中 的 占 比 , 使 问卷 在 存在 
条 目 表 述 效应 的 条 件 下 有 具备 更 好 的 结构 效 度 ， 特 质变 异 大 于 方法 变异 ( 书 嘉 等 , 2016)。 
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预 设 路 径 模型 。 预 设 路 径 模型 (fixed-links model) 专 门 用 于 实验 研究 ， 主 要 作用 是 分 离 
验 中 的 目标 因子 和 无 关 因 子 , 令 实 验 目标 概念 的 测量 更 准确 。 洪 变量 由 1 个 目标 因子 和 若干 
个 非 目 标 因子 构成 。 因 子 载荷 固定 ， 且 允许 跨 因子 载荷 。 目 标 因 子 载荷 根据 已 有 理论 知识 和 
经 验 指定 ， 而 非 目标 因子 载荷 统一 设 定 为 一 个 常数 。 模 型 的 评价 除了 拟 合 指数 ， 还 依赖 目标 
因子 方差 。 目 标 因子 方差 显著 表示 该 潜 变 量 所 代表 的 心理 过 程 是 完成 任务 所 必须 的 ( 任 学 柱 


等 , 2017)。 
瑟 斯 顿 模 型 。 社 科研 究 中 常见 到 配对 比较 任务 和 排序 任务 。 配对 比较 任务 如 : 在 配对 呈 
现 的 两 个 面孔 图 片 中 选择 更 喜欢 的 一 个 ;而 排序 任务 如 : 将 3 个 面孔 图 片 按 喜 好 程度 排序 。 
任务 产生 的 数据 为 等 级 数据 ， 不 满足 经 典 测量 理论 的 基本 假设 ( 王 珊 等 , 2014)， 最 好 用 专门 
的 模型 分 析 ， 比 如 瑟 斯 顿 模型 (Thurstone modeD) 。 该 模型 中 潜 变 量 表示 比较 或 排序 任务 中 的 
> 某 个 选项 , 而 潜 变 量 所 属 测 量 指标 为 被 试 对 该 选项 与 其 它 选项 的 偏好 选择 结果 。 若 被 试 偏好 
当前 选项 ， 则 因子 载荷 固定 为 1， 否则 为 -1。 对 于 排序 任务 ， 测 量 指标 的 残 差 设 定 为 0。 这 
种 模型 的 优势 在 于 ， 可 以 同时 得 到 各 任务 选项 均值 差异 的 详细 信息 及 被 试 的 个 体 差 异 信 息 ; 
能 侦 测 到 细小 的 选项 差异 ， 可 以 避免 社会 赞许 性 的 影响 ( 宋 晓 娟 , 刘 红 云 , 2016)。 
2.1.4 形成 性 测量 模型 
形成 性 测量 模型 (formative measurement model, FM) 是 测量 模型 的 一 种 特殊 形式 。FM 与 
传统 的 测量 模型 (也 可 称 为 反映 性 模型 ; reflective measurement model, RM) 的 主要 区 别 体 现在 
(页 跃 千 ， 宝 贡 敏 , 2009): (DRM 中 因子 影响 测量 指标 ; FM 则 机 因子 由 测量 指标 所 构建 ; 
Cc (2)RM 要 求 测量 指标 具有 高 内 部 一 致 性 ， 可 以 互 换 ，FM 测量 指标 可 以 不 相关 甚至 负 相 关 ， 
编制 测量 指标 更 要 紧 的 是 涵盖 构 念 的 所 有 方面 , RM 的 信 效 度 及 拟 合 评价 指标 往往 不 适用 于 
FM; (3)RM 的 误差 项 体现 在 测量 指标 层次 ; FM 的 误差 项 体现 在 潜 变 量 层次 ; (4)RM 适用 
于 验证 性 的 研究 , 注重 理论 模型 与 实际 数据 的 拟 合 及 参数 估计 的 准确 性 ; 而 FM 适用 于 探索 
性 的 研究 ， 更 关注 测量 指标 对 潜 变 量 的 预测 效力 。 
虽然 FM 并 未 如 RM 一 样 流行 (页 跃 千 ， 宝 贡 敏 , 2009), 但 在 国内 也 受到 一 定 关注 ， 有 一 
些 研究 介绍 该 模型 的 基本 原理 和 特征 ( 王 念 新 等 , 2013; 王 晓 丽 等 , 2011; 叶 浩 生 , 李 明 ， 
2014)。 王 念 新 等 2011) 的 模拟 研究 表明 ， 如 果 将 FM 误 设 为 RM 可 能 造成 路 径 系数 的 估计 偏 
差 和 两 类 错误 率 的 升 高 ， 建 议 利用 模型 细 化 法 和 模型 分 解法 来 避免 模型 误 设 。 
2 结构 模型 的 发 展 
社 科 研究 常常 关注 成 对 数据 (dyadic data)， 如 配偶 双方 、 师 生 双 方 及 上 下 级 双方 等 在 同 
一 变量 上 的 数据 。 此 类 数据 往往 不 具备 独立 性 ( 李 育 辉 ， 黄 飞 , 2010)。 为 避免 可 能 的 两 类 错误 
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膨胀 ， 需 要 专门 的 统计 方法 。 主 客体 互 依 模 型 (actor-partner interdependence model, APIM) 是 
一 种 专门 分 析 成 对 变量 关系 的 结构 模型 。 以 教师 和 学 生 的 共 情 能 力 ( 自 变量 ) 对 教师 和 学 生 的 
领悟 社会 支持 ( 因 变 量 ) 的 影响 为 例 ， 主 客体 互 依 模 型 具体 路 径 设 定 包括 4 个 部 分 : (1) 学 生 / 
教师 共 情 对 其 自身 领悟 社会 支持 的 影响 ， 即 主体 效应 ;，(2) 学 生 / 教 师 共 情 对 对 方 的 领悟 社会 
支持 的 影响 ， 即 客体 效应 ，(3) 学 生 和 教师 共 情 的 相关 ， 这 一 设 定 可 以 在 分 析 某 一 自 变量 的 
效应 时 ， 控 制 另 一 自 变 量 的 影响 ，(4) 学 生 和 教师 的 因 变量 残 差 相关 ， 用 于 控制 除 自 变量 之 
外 的 其 它 因 变量 互 依 性 来 源 (刘畅 , 伍 新 春 , 2017)。 通 过 APIM 可 以 分 析 主 体 效 应 和 客体 效应 
的 大 小 和 方向 特点 及 何者 更 占 优势 APIM 具体 的 原理 ( 李 育 辉 , BK, 2010)、 分 析 流 程 (刘畅 ， 
伍 新 春 , 2017)、 模 型 变 式 (如 含 中 介 和 调节 变量 的 APIM; 陈 莎 等 , 2020; 刘畅 ， 伍 新 春 , 2017) 
及 软件 操作 (如 Mplus 和 SPSS; 陈 莎 等 ,2020; 何 娟 等 , 2018) 可 参考 相关 方法 文献 。 
> 2.3 全 模型 的 发 展 
条 目 打包 (item parceling) 可 以 视 为 全 模型 构建 的 一 种 特殊 方法 。 这 种 方法 将 测验 原始 条 
目 聚 合成 条 目 包 , 牺牲 了 测量 模型 分 析 的 可 靠 性 ,但 能 改善 结构 模型 的 参数 估计 和 模型 拟 合 。 
国内 关于 条 目 打包 的 研究 涉及 两 个 方面 ， 一 是 对 打包 技术 及 策略 的 介绍 和 演示 。 如 证 冉 等 
(2007) 详 细 介绍 了 条 目 打包 的 基本 逻辑 、 优 劣势 及 具体 方法 。 而 吴 艳 和 温 忠 麟 (2011) 在 此 基 
础 上 进一步 细 化 了 打包 方法 并 给 出 了 操作 流程 。 对 于 单 维 量 表 , 前 一 组 研究 者 从 经 济 实用 的 
度 出 发 ， 推 荐 随机 法 打包 ( 即 条 目 打 包 不 依循 任何 规律 ; 卞 髓 等 , 2007); 后 一 组 研究 者 从 拟 
合 提升 最 大 的 角度 出 发 ， 推 荐 平衡 法 ( 即 首先 将 条 目 按 因子 载荷 高 低 排序 ， 再 按照 “S" 形 顺序 
分 配 各 包 条 目的 方法 ; R, 温 忠 麟 , 2011)， 对 于 多 维 量 表 ， 两 组 研究 者 都 建议 采用 内 部 一 
致 性 法 ( 即 每 个 维度 内 所 有 条 目 聚 合成 一 个 条 目 包 ; 卞 冉 等 , 2007; Ri, ER, 2011), 因为 
该 法 保留 了 湾 变 量 的 多 维 结构 。 王 若 宾 (2014) 等 建议 对 全 模型 中 的 多 维 量 表 按 维度 均 分 打 
包 , 并 通过 实例 演示 说 明 该 方法 可 以 简化 模型 , 提升 对 路 径 系数 的 检验 力 , 并 获得 理想 拟 合 。 
第 二 个 方面 是 条 目 打 包 和 其 它 模型 形式 的 比较 ， 如 杨 彤 观 等 2010) 用 一 个 应 用 实例 比较 了 条 
目 打包 、 路 径 分 析 及 未 打包 的 全 模型 ， 结 果 发 现 条 目 打 包 的 模型 拟 合 指数 比较 好 ， 而 未 打包 
全 模型 所 得 的 测定 系数 及 要 高 于 条 目 打 包 和 路 径 分 析 。 
2.4 群体 异 质 性 研究 中 的 结构 方程 模型 
探究 不 可 直接 观测 的 群体 异 质 性 是 很 多 研究 的 兴趣 所 在 ， 由 此 众生 了 大 量 基于 SEM 的 
异 质 性 分 析 方 法 。 刘 源 和 刘 红 云 (2015) 及 李 丽 霞 等 (2015) 对 此 类 方法 进行 了 总 结 ， 主 要 包括 : 
潜 类 别 /剖面 模型 、 因 子 混 合 模型 和 多 水 平 潜 类 别 模型 。 


2.4.1 潜 类 别 / 潜 剖 面 模型 


$È 


潜 类 别 / 潜 剖面 模型 是 根据 潜在 特质 得 分 对 被 试 进行 分 类 的 测量 模型 ( 张 洁 婷 等 , 2010)， 


是 聚 类 分 析 思 想 在 SEM 中 的 体现 。 若 测量 指标 是 类 别 变量 ， 则 为 潜 类 别 模型 latent class 


model, LCM); 若是 连续 变量 ， 则 为 潜 剖 面 模型 (latent profile model, LPM). 
国内 关于 LCM/LPM 的 研究 涉及 三 个 方面 ,第 一 是 对 LCM/LPM 基本 原理 和 分 析 流程 的 
介绍 。 如 张 洁 婷 等 (2010) 介 绍 了 LCM 的 统计 原理 、 分 析 过 程 及 在 心理 学 研究 中 的 应 用 情况 。 
郭 小 玲 等 2009)、 备 燥 等 2010) 及 曾 完 华 等 (2013) 分 别 用 模拟 研究 数据 和 应 用 案例 演示 了 
LCM 的 分 析 流 程 ,。 尹 奎 等 (2020) 介 绍 了 LPM 的 基本 原理 、 步 又 及 在 组 织 行为 研究 中 的 应 用 。 
第 二 是 对 包含 协 变量 的 LCM/LPM 或 潜 类 别 与 协 变量 关系 分 析 的 研究 , 如 王 孟 成 和 毕 向 
阳 (2018) 总 结 了 含 协 变量 的 LCM( 即 回归 混合 模型 ) 的 分 析 方 法 并 给 出 了 Mplus 语句 模板 。 学 
界 一 般 推荐 用 LTB 法 (Lanza et al., 2013) 处 理 分 类 结果 变量 ， 用 BCH 法 (Bolck et al., 2004) 或 
> 稳健 三 步 法 处 理 连 续 结果 变量 ， 后 者 也 适用 于 协 变量 是 预测 变量 的 情形 ( 王 备 成 ， 毕 向 阳 ， 
2018)。 张 洁 婷 等 (2017) 介 绍 了 LPM 后 续 分 析 ( 即 分 出 潜 类 别 后 , 探究 潜 类 别 与 前 因 后 果 变量 
关系 的 分 析 ) 的 方法 ， 并 通过 模拟 研究 比较 指出 ， 纳 入 式 分 类 分 析 法 ( 即 潜 剖面 分 类 时 就 将 后 
续 分 析 需 要 的 变量 作为 协 变 量 纳 入 模型 ) 的 后 续 分 析 参 数 估计 效果 比较 好 ， 兼 有 准确 性 和 稳 
健 性 。 进一步 研究 则 发 现 ， 当 纳入 的 后 续 分 析 变 量 包含 结果 变量 及 自 变 量 与 潜 类 别 变 量 的 乘 
积 项 时 ， 后 续 参 数 估计 效果 比较 好 。 更 具体 的 分 析 流 程 见 张 洁 婷 等 (2019)。 
第 三 是 通过 模拟 研究 考察 LCM/LPM 的 分 类 效果 , 包括 LCM/LPM 与 其 它 个 体 中 心 方法 
的 比较 及 不 同 数据 和 模型 条 件 对 分 类 结果 的 影响 。 如 马 文 超 等 (2014) 通 过 模拟 比较 发 现 ， 除 
Cc 只 有 两 个 潜 类 别 且 各 类 样本 容量 极端 不 均衡 的 特殊 情况 外 , LCM 和 快速 聚 类 法 及 混合 Rasch 
PT 模型 的 分 类 精度 相当 。 赵 丽 等 (2013) 通 过 模拟 比较 指出 LPM 的 分 类 准确 率 高 于 系统 聚 类 法 。 
王 重 成 、 邓 俏 文 、 毕 向 阳 等 2017) 通 过 模拟 研究 考察 了 LPM 中 类 别 数 、 类 间距 、 样 本 容 


和 测量 指标 个 数 对 Entropy 分 类 精确 性 的 影响 。 


中 


Hn 


2.4.2 因子 混合 模型 

因子 混合 模型 (factor mixture model) CFA 和 LCM 整合 在 同一 个 模型 中 ， 可 以 看 作 是 
一 种 以 CFA 中 潜 变 量 为 分 类 指标 的 LCM; 也 可 以 看 作 是 考虑 了 群体 异 质 性 的 CFA 模型 。 
陈 宇 帅 等 (2015) 介 绍 了 因子 混合 模型 的 基本 原理 、 主 要 优势 、 应 用 方向 及 分 析 步 又。 李 观 海 
等 (2020) 比 较 了 不 同样 本 量 和 因子 间 相 关 条 件 下 潜 类 别 因子 模型 (因子 混合 模型 变 式 之 一 , 假 
定 群体 异 质 性 仅 存 在 于 洪 均 值 ) 和 LCM 的 表现 , 结果 显示 前 者 的 模型 拟 合 及 分 类 效果 都 好 于 
后 者 ， 且 模型 更 精简 和 易于 识别 。 

2.4.3 多 水 平 潜 类 别 模型 


多 水 平 LCM 是 专门 针对 多 水 平 结构 数据 的 LCM， 可 以 针对 相同 的 测量 指标 在 个 体 ( 层 
1) 和 组 织 ( 层 2) 层 级 分 别 进行 分 类 。 张 洁 婷 等 (2013) 介 绍 了 多 水 平 潜 类 别 模型 的 基本 原理 ， 以 
小 学 英语 能 力 测验 为 例 演示 了 多 水 平 LCM 的 分 析 步 又 , 并 比较 了 多 水 平 LCM 与 一 般 LCM 
的 效果 差异 。 

2.5 追踪 研究 中 的 结构 方程 模型 

追踪 研究 是 一 种 通过 对 相同 的 研究 对 象 和 变量 重复 测量 多 次 , 对 序列 数据 进行 处 理 、 分 
析 ， 以 了 解 变 量 发 展 趋势 、 变 量 之 间 相 互 关 系 及 个 体 差异 的 研究 设计 。 国 内 追踪 研究 中 的 
SEM 方法 主要 涉及 描述 发 展 趋势 及 差异 的 模型 ( 潜 增 长 模型 、 多 阶段 增长 模型 、 潜 类 别 增长 
模型 、 增 长 混合 模型 、 多 阶段 混合 增长 模型 和 潜在 转变 模型 ) 及 探究 变量 间 相 互 影响 的 模型 
(交叉 滞后 模型 )。 

2.5.1 描述 发 展 趋势 及 差异 的 模型 

潜 增 长 模型 。 潜 增长 模型 (latent growth model, LGM) 以 不 同时 间 点 的 变量 观测 值 作为 测 
量 指标 ， 用 一 个 截 距 因子 反映 被 试 的 特质 基线 水 平 (因子 载荷 固定 为 )， 若 干 斜率 因子 反映 
特质 的 线性 或 非 线 性 变化 趋势 。 可 同时 用 于 探究 心理 特质 的 个 体 差异 与 发 展 趋势 。 已 有 不 少 
方法 文献 介绍 LGM 的 基本 原理 、 常 见 变 式 、 软 件 操作 (如 Mplus 和 SAS) Xe (Ri KAAS (PANES 
等 , 2012; 宋 秋 月 , 伍 亚 舟 , 2017; IRW, RRI, 2017; VFA, 2007). ZENN HEF (2014) 
从 模型 数学 形式 、 前 提 假 设 、 数 据 格式 、 参 数 估计 及 建 模 的 灵活 性 与 复杂 性 等 角度 比较 了 
LGM 和 多 水 平 模型 ， 指 出 多 水 平 建 模 更 加 简单 直接 ; LGM 更 加 灵活 ， 可 以 放松 对 测量 
误差 相等 的 限制 ， 自 由 估计 每 次 测量 误差 ， 参数 估 计 精 度 更 好 。 

多 阶段 增长 模型 。LGM 假定 个 体 的 发 展 轨迹 总 是 连续 的 ， 忽 视 发 展 可 能 存在 的 阶段 性 
与 转折 点 (如 前 期 增长 慢 而 后 期 增长 快 )。 多 阶段 增长 模型 (piecewise growth models, PGM) fù 
许 增长 曲线 有 不 同 发 展 阶段 。 刘 源 等 (2013) 通 过 模拟 研究 探讨 了 SEM 和 多 水 平 模型 框架 下 
定义 的 PGM 的 参数 估计 效果 差异 及 将 PGM 错误 设 定 为 无 阶段 模型 的 后 果 。 

潜 类 别 增长 模型 和 增长 混合 模型 。LGM 假设 潜 变 量 在 个 体 间 的 发 展 轨迹 相同 ， 忽 视 了 


可 能 存在 的 异 质 性 。 潜 类 别 增长 模型 (latent class growth model, LCGM) 和 增长 混合 模型 
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(growth mixture model, GMM) 通 过 结合 LCM 和 LGM, 可 以 将 个 体 按照 特质 发 展 趋 势 的 不 同 
进行 分 类 ， 前 者 假定 同一 类 别 内 个 体 无 差异 ， 后 者 无 此 限制 ( 李 丽 霞 等 , 2015)， 前 者 可 视 为 


后 者 特例 ( 王 备 成 等 , 2014; 肖 健 等 ,2020)。 有 关 LCGM 的 详细 介绍 参见 吕 温 尘 和 赵 然 (2018) 


或 王 孟 成 等 (2014); 有 关 GMM 的 详细 介绍 参见 刘 红 云 (2007)、 王 备 成 等 (2014)、 肖 健 等 (2020) 


或 喻 嘉宏 等 (2018)。 


多 阶段 混合 增长 模型 。 多 阶段 混合 增长 模型 (piecewise growth mixture model, PGMM) 是 
PGM 和 GMM 的 结合 ， 人 允许 发 展 轨迹 既 分 阶段 ， 又 有 群体 异 质 性 。 王 婧 等 (2017) 详 细 描述 
T PGMM 的 基本 原理 、 常 见 模型 形式 、 参 数 估 计 方 法 及 影响 因素 、 样 本 量 需 求 、 拟 合 评价 
指标 、 应 用 现状 及 未 来 研究 方向 。 刘 源 等 (2014) 则 利用 模拟 研究 考察 了 潜 类 别 间距 和 发 展 模 
型 形态 对 PGMM 的 模型 选择 及 参数 估计 的 影响 。 

潜在 转变 模型 。 潜 在 转变 模型 (latent transition model, LTM) 是 LCM 在 追踪 研究 中 的 推 
广 , 不 仅 可 以 探究 各 时 间 点 可 能 存在 的 潜 类 别 ,允许 潜 类 别 发 生变 化 ， 还 可 以 考察 个 体 从 某 
一 类 别 转变 为 其 它 类 别 的 概率 。 王 碧 瑶 等 (2015) 和 黄 明 明 (2019) 介 绍 了 LIM 的 统计 原理 ， 并 
分 别 以 青少年 冲动 行为 和 英语 阅读 理解 测验 为 例 ， 演 示 了 LTM 的 分 析 过 程 和 结果 解读 。 黄 
明明 (2018) 介 绍 了 基于 混合 项 目 反应 理论 的 LTM 的 理论 基础 、 转 变 机 制 、 模 型 特性 、 应 用 
现状 及 发 展 前 景 。 

2.5.2 探究 变量 间 相互 影响 的 模型 

交叉 滞后 模型 (cross-lagged model) 通 过 分 析 多 变量 间 跨 时 间 的 相互 影响 ， 可 以 探索 变量 
间 谁 是 因 谁 是 果 。 模 型 重点 关注 的 效应 包括 (对 源 等 , 2022): (1) 自 回归 效应 ， 即 同一 变量 前 
测 对 后 测 的 影响 ， 反 映 变量 的 跨 时 间 稳 定性 ( 重 测 信和 度 ); (2) 交 叉 灌 后 效应 ， 即 控制 变量 B 前 
测 时 变量 4 前 测 对 变量 如 后 测 的 效应 和 控制 变量 4 前 测 时 变量 8 前 测 对 变量 4 后 测 的 效应 。 
A 和 B 的 因果 顺序 判断 依据 是 前 测 原因 变量 对 后 测 结 果 变 量 的 预测 作用 (以 标准 化 路 径 系 数 
表示 ) 应 明显 高 于 前 测 结 果 变 量 对 后 测 原 因 变 量 的 预测 作用 ( 周 广 帅 等 ,2020)。 该 方法 可 以 使 
问卷 研究 更 好 地 满足 因果 推论 对 于 因果 先后 顺序 及 无 关 变 量 控制 的 要 求 ( 温 忠 麟 , 2017)。 
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3 结构 方程 模型 参数 估计 方法 

SEM 的 参数 估计 基于 对 协 方差 结构 的 分 析 。 设 2(0) 和 分 别 为 根据 理论 模型 得 出 的 协 
方差 矩阵 和 样本 协 方差 矩阵 ，6 为 参数 向 量 。 用 拟 合 函数 FLS, 2(9)] 表 示 2(9) 与 8 的 距离 。 参 
数 估计 的 过 程 即 求 得 使 FLS, 2(9)] 达 到 最 小 值 的 6 估计 值 的 过 程 。 不 同 拟 合 函数 构建 方式 产生 
了 不 同 的 参数 估计 方法 。 使 用 最 多 的 方法 是 极 大 似 然 估计 (maximum likelihood estimate, 


ML)。 当 数据 非 正 态 , 通常 使 用 稳健 极 大 似 然 估计 (robust maximum likelihood estimate, MLR) 


I 


或 均值 和 方差 校正 的 加 权 最 小 二 乘 估计 (weighted least squares with mean and variance 
adjusted, WLSMV)。 前 者 对 因子 间 相 关 及 参数 标准 误 的 估计 更 准确 ， 后 者 对 因子 载荷 的 估计 
更 准确 (Li, 2016)， 且 更 适合 计 分 点 数 偏 少 的 数据 。 


到 内 有 关 SEM 参数 估计 方法 的 研究 ， 主 要 涉及 两 个 方面 : 一 是 方法 的 介绍 ， 主 要 包括 
偏 最 小 二 乘法 (partial least square, PLS) 和 贝 叶 斯 法 (Bayesian methods); 二 是 参数 估计 方法 的 
比较 。 

3.1 偏 最 小 二 乘法 

传统 参数 估计 方法 求解 SEM 是 令 拟 合 函数 最 小 化 的 过 程 ， 强 调 参数 估计 精度 ， 而 PLS 
求解 SEM 则 是 令 残 差 方 差 最 小 化 的 过 程 ， 强 调 方程 中 预测 变量 对 结果 变量 的 预测 精度 ， 这 
一 特点 与 形成 性 建 模 的 主要 目的 (追求 测量 指标 对 因子 的 解释 能 力 最 大 化 ) 非 常 契 合 ( 王 念 新 
等 , 2013)， 因 此 PLS 常常 被 用 于 分 析 形 成 性 模型 ， 通 常 使 用 专用 软件 如 SmartPLS 、semPLS 
或 WarpPLS 进行 分 析 。 相 比 于 传统 参数 估计 方法 ，PLS 的 优势 主要 在 于 : (1) 更 适合 小 样本 
和 非 正 态 数据 ; (2) 适 合 复杂 模型 ( 即 变 量 数 与 样本 容量 之 比较 高 的 模型 ); (3) 适 合 形成 性 模型 

> 分 析 ; (4) 适 合 对 多 个 预测 变量 的 作用 进行 探索 的 SEM 研究 ( 骆 雷 , 2020)。 

HAAK PLS 的 介绍 主要 涉及 两 个 方面 ， 一 是 对 PLS 的 介绍 与 评价 ， 如 朱 利 平 和 刘 莉 
(2005)、 宁 禄 乔 等 (2007) 详 细 介 绍 了 PLS 的 参数 估计 过 程 。 孙 继 红 和 杨 晓 江 (2009) 总 结 并 讨 
论 了 基于 PLS 的 SEM 涉及 的 三 个 重要 问题 : 测量 模型 如 何 选择 、 如 何 用 bootstrap 法 估计 和 
检验 参数 及 如 何 评价 模型 。 刘 金兰 (2005) 等 讨论 了 PLS 算法 的 几何 意义 。 宁 禄 乔 和 刘 金 兰 
(2007) 通 过 模拟 研究 考察 了 PLS 估计 SEM 参数 的 效果 ， 发 现 该 方法 低估 结构 系数 ， 高 估 因 
子 载荷 。 当 样本 容量 较 大 时 ， 结 果 基 本 可 信 。 

第 二 是 PLS 在 特定 模型 及 数据 中 的 拓展 ， 如 林 盛 等 (2006) 介 绍 了 两 个 潜 变 量 的 PLS 算 
法 如 何 扩展 到 适用 于 多 个 潜 变 量 。 程 豪 和 易 丹 辉 (2016) 介 绍 了 用 PLS 估计 二 阶 因子 模型 的 基 
本 原理 和 优点 ; 赵 萍 (2011) 讨 论 了 使 用 PLS 估计 二 阶 因 子 模型 时 不 同 权 重 估计 算法 模式 的 优 
劣 。 王 芝 卑 等 2020) 介 绍 了 PLS 路 径 模 型 的 分 位 效应 (一 般 的 SEM 是 用 自 变量 预测 因 变 量 均 
值 ， 分 位 效应 则 是 指 用 自 变 量 预 测 因 变量 百 分 位 数 ) 估 计 方 法 。 盏 洁 和 王 惠 文 (2009)、 李 顺 勇 
和 扼 利 梅 (2017) 分 别 介绍 了 如 何 将 基于 PLS 的 路 径 分 析 和 基于 PLS 的 SEM 用 于 处 理 成 分 数 
据 ( 即 在 0~1 之 间 取 值 、 和 为 1 的 数据 )。 任 红 梅 和 王 绥 (2010) 介 绍 并 推荐 使 用 模糊 PLS 来 为 
有 具有 不 确定 性 的 数据 (比如 Likert 量 表 的 中 间 项 往往 表示 不 确定 ) 进 行 SEM 建 模 。 应 用 实例 
表明 ， 该 方法 的 参数 估计 精确 度 优 于 未 经 模糊 处 理 的 PLS， 且 模型 拟 合 更 好 。 

3.2 贝 叶 斯 法 

贝 叶 斯 统计 分 析 是 一 种 将 已 有 的 对 于 待 估计 参数 的 经 验 和 知识 ( 即 先 验 信息 ) 融 入 参数 
估计 的 过 程 。 贝 叶 斯 法 用 于 SEM 时 的 参数 估计 过 程 如 下 : 


(1) 首 先 设 定理 论 模 型 ,这 一 步 和 普通 SEM 无 异 。(2) 设 定 所 有 未 知 参 数 的 先 验 分 布 参数 
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(也 称 超 参数 )。 研 究 中 感 兴趣 的 参数 一 般 是 目标 因子 载荷 和 路 径 系 数 ， 通 常 假定 服从 正 态 分 
志 


布 , 需 设 定 均 值 和 方差 两 个 参数 , 可 参照 已 有 研究 特别 是 元 分 析 ( 受 宁 ， 毛 


雄 等 , 2018)。 需 


NI 


要 强调 ， 尽 管 很 多 软件 能 给 出 默认 先 验 分 布 参数 (无 信息 先 验 ， 相 当 于 仅 采 用 贝 叶 斯 的 估计 


框架 ， 但 却 不 利用 先 验 信息 )， 但 贝 叶 斯 法 的 核心 优势 是 利用 先 验 信息 帮助 参数 估计 。 有 下 


究 发 现 使 用 无 信 


有 信息 先 验 。 


(3) 利 用 马尔 


息 先 验 并 不 比 ML 强 , 甚至 小 样本 时 基于 无 信息 先 验 的 贝 叶 斯 估计 还 可 能 造 
成 严重 不 稳定 和 有 偏 的 估计 结果 (Smid & Winter, 2020)。 因 此 采用 贝 叶 斯 法 时 ， 应 尽量 使 用 


可 夫 链 蒙特 卡 洛 方法 (Markov chain Monte Carlo, MCMC) 的 Gibbs 抽样 获取 


参数 后 验 分 布 ( 张 言 彩 , 2009)。 估 计 结 果 是 否 收敛 可 以 利用 潜在 尺度 缩减 因子 (potential scale 


reduction), ERX 


ZUEK, Xi 


图 (trace plots) 及 有 效 样本 容量 (effective sample size) 等 判定 (有 具体 的 解读 方法 


后 验 分 布 的 集中 


肖 文 ， 毕 向 阳 , 2017 和 Smid & Winter, 2020)。 佑 计 收 敛 后 


量 数 (如 均值 或 


位 数 ) 可 以 作为 模型 参数 的 点 估计 值 。 同 时 ， 有 了 后 验 分 布 ， 可 以 获取 基于 


贝 叶 斯 法 的 可 信 


区 间 (credible interval). 


相 较 传统 的 基于 频率 理论 的 SEM 参数 估计 方法 ， 贝 叶 斯 法 的 主要 优点 是 : (1) 小 样本 条 
件 下 估计 效果 更 好 , 尤其 是 能 够 提供 有 效 先 验 信息 时 ; (2) 计 算 速 度 更 快 ( 王 备 成 , 邓 俏 文 ， 毕 
向 阳 , 2017); (3) 当 模型 复杂 ， 或 待 估计 参数 和 样本 容量 之 比较 高 时 ， 传 统 参 数 估计 容易 出 现 
收敛 问题 , 而 贝 叶 斯 方法 往往 能 收敛 到 恰当 解 ( 梁 芋 娅 , 杨 艳 云 ,2016; ER, 邓 俏 文 ， 毕 向 


BH, 2017); (4) Ul 


叶 斯 方法 受 非 正 态 的 影响 更 小 ( 受 宁 ,， 李 英 等 , 2018); (5) 传 统 方法 不 可 识别 


的 模型 (比如 令 所 有 跨 因子 载荷 和 残 差 相关 自由 估计 会 因 用 尽 自 由 度 导 致 模型 不 可 识别 )， 通 


过 纳入 先 验 信 息 和 采用 MCMC 方法 ， 仍 有 可 能 识别 ( 受 宁 ， 李 英 等 , 2018); (6) 通 过 贝 叶 斯 法 


ERR, X 


获得 的 可 信 区 间 解 释 上 比 传统 置信 区 间 更 直观 。 


人 悄 文 和 毕 向 阳 (2017、 曼 宁 和 李 英 等 2018) 介 绍 了 基于 贝 叶 斯 法 的 


SEM(BSEM) 的 基本 概念 并 用 示例 演示 了 分 析 过 程 和 结果 解释 。 张 沥 今 等 (2019) 分 析 了 贝 叶 
斯 法 在 不 同 SEM 变 式 ( 如 普通 的 测量 模型 、 潜 中 介 模 型 、 潜 增长 模型 .多 组 SEM 及 多 层 SEM) 
中 的 应 用 优势 及 现状 ， 并 对 BSEM 的 模型 评价 及 可 用 软件 做 了 介绍 。 秦 正 积 等 (2020) 介 绍 了 
如 何 使 用 SAS 软件 调用 OpenBUGS 程序 以 更 高 效 地 实现 BSEM。 


3.3 其 它 参 数 估计 方法 


除了 PLS 和 


贝 叶 斯 法 ， 吴 瑞 林 (2012) 建 议 用 Tikhonov 正则 化 方法 修正 ML 的 参数 估计 ， 


模拟 研究 表明 这 有 助 于 提升 收敛 率 和 收敛 速度 ,减少 不 恰当 解 ， 并 降低 估计 偏差 。 对 于 二 分 
类 数据 和 顺序 等 级 数据 ， 有 研究 者 建议 采用 多 项 相关 矩阵 来 估计 模型 参数 ( 吴 瑞 林 , ASE ZS, 
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2010)， 并 给 出 LISREL 实例 语句 ( 王 欢 等 , 2012; 吴宇 驹 等 , 2012)。 比 起 基于 皮尔 逊 相 关 和 矩阵 
的 参数 估计 ， 多 项 相关 和 矩 阵 得 到 的 参数 估计 值 偏差 更 小 ( 周 映 雪 等 , 2013). MFR. XIAN 
等 (2009) 介 绍 了 SEM 的 约束 最 小 二 乘 解 ， 并 将 其 推广 到 高 阶 测量 模型 和 多 组 SEM 中 ( 童 
BE, ABER, 2009)。 该 方法 可 以 提升 参数 估计 的 收敛 率 和 收敛 速度 ， 并 获得 唯一 解 。 

3.4 参数 估计 方法 比较 


SEM 参数 估计 方法 比较 研究 一 部 分 关注 加 权 最 小 二 乘法 (weighted least squares)、 对 角 加 


ox. 


权 最 小 二 乘法 (diagonal weighted least squares) 和 广义 最 小 二 乘法 (generalized least squares) HY 
RMF, 王 长 义 等 , 2015; FRE WE, 汪 东 伟 等 , 2015; 吴 瑞 林 , 2010)。 不 过 这 些 方法 应 用 
不 多 ， 且 早 有 文献 指出 ， 与 ML 相 比 它们 的 综合 表现 并 不 突出 ( 侯 杰 泰 等 , 2004)。 

更 值得 注意 的 是 当前 流行 的 估计 方法 和 新 方法 的 比较 。 比 如 刘 红 云 、 骆 方 等 (2012) 模 拟 


比较 了 MLR. WLSMV 和 MCMC 方法 估计 二 分 类 数据 测量 模型 的 精度 。 结 果 发 现 ,三 种 方 


法 对 因子 载荷 等 参数 的 估计 精度 都 比较 好 , MLR 和 WLSMV 略 优 于 MCMC 方法 , WLSMV 
还 具备 运算 速度 快 的 优势 。 田 晓 明 和 侍 球 生 (2004, 2005) 模 拟 比 较 了 ML 和 贝 叶 斯 法 在 SEM 
参数 估计 中 的 表现 ， 结 果 发 现 贝 叶 斯 法 估计 精度 略 优 于 ML， 但 并 不 明显 。 梁 芋 娅 和 杨 艳 云 
(2016) 模 拟 比较 了 MLR 和 无 先 验 贝 叶 斯 法 在 测量 模型 中 的 表现 。 结 果 发 现 : (D) 对 于 识别 错 
误 模 型 的 能 力 , 在 非 正 态 条 件 下 , 贝 叶 斯 方法 更 强 ; 但 在 正 态 条 件 下 , 贝 叶 斯 方法 不 如 MLR。 
(2) 贝 叶 斯 法 收敛 能 力 远 强 于 MLR， 这 个 优势 在 复杂 模型 (如 双 因 子 模型 ) 中 尤为 明显 。 受 宁 
和 和 毛 志雄 等 (2018) 通 过 一 个 应 用 实例 比较 了 ML 和 贝 叶 斯 法 在 小 样本 潜 变量 建 模 中 的 表现 ， 
尽管 二 者 对 路 径 系数 及 因子 载荷 等 参数 估计 结果 接近 ， 但 前 者 会 出 方差 为 负 这 样 的 异常 解 。 
PT 霍 映 宝 (2006)、 李 晓 鸿 (2012) 和 张 军 (2007) 从 参数 估计 目的 、 基 本 原理 、 前 提 条 件 等 理论 

方面 比较 了 PLS 与 传统 参数 估计 方法 (如 ML、 加 权 最 小 二 乘法 、 对 角 加 权 最 小 二 乘法 和 广 

义 最 小 二 乘法 ) 的 区 别 ， 章 刚 勇 2015) 则 对 二 者 做 了 模拟 比较 ， 结 果 发 现 PLS 参数 估计 的 稳 

定性 强 于 传统 方法 ， 但 是 对 误 设 模型 的 敏感 性 较 低 。 刘 燕 和 陈 英武 (2007) 提 出 用 广义 最 大 人 
法 (Generalized Maximum Entropy) 估 计 SEM 参数 ， 并 模拟 比较 了 广义 最 大 炉 法 和 PLS 的 参 


数 估 计 偏 差 ， 结 果 广 义 最 大 箭 法 获得 的 参数 均 方 误差 总 是 小 于 PLS。 


4 结构 方程 模型 评价 
对 SEM 参数 的 解读 是 建立 在 假设 模型 与 实际 数据 拟 合 良好 的 基础 上 的 。 评 价 模型 拟 合 
主要 通过 拟 合 指数 ， 涉 及 到 的 方法 学 问题 包括 新 拟 合 指数 的 提出 、 拟 合 指数 的 临界 值 、 拟 合 
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指数 的 选择 及 拟 合 指数 之 外 的 模型 评价 标准 。 此 外 ,多 个 模型 间 的 比较 和 选择 也 是 模型 评价 
的 重要 方面 。 
4.1 拟 合 指数 的 发 展 

H SEM 流行 以 来 ， 研 究 者 陆续 提出 过 四 十 多 个 拟 合 指数 ， 温 忠 麟 等 (2004) 探 讨 了 好 的 
拟 合 指数 应 有 的 性 质 (不 受 样本 容量 系统 影响 、 惩 罚 复 杂 模 型 及 对 误 设 模型 敏感 )。 现 在 普遍 


WA, CFl(comparative fit index), TLI(Tucker-Lewis index), RMSEA(root mean square error of 


approximation) 和 SRMR (standardized root mean square residual) 是 统计 学 性 质 较 好 的 拟 合 指 


数 ( 温 忠 麟 ， 刘 红云 , 2020)。 
近年 来 有 研究 尝试 提出 新 的 拟 合 指数 ， 比 如 王 凯 等 C2018) 针 对 拟 合 指数 


GFI(goodness-of-fit index) 受 样本 容量 系统 影响 及 未 惩罚 复杂 模型 的 缺陷 ， 提 出 了 校正 后 的 


GFI(corrected GFI, CGFD 。 另 一 种 新 拟 合 指数 是 Yuan 和 Chan(2016) 提 出 的 基于 等 效 性 检验 


的 拟 合 指 数 (equivalence-testing-based fit indice; 王 阳 等 , 2020)。 其 基本 思想 是 ， 针 对 传统 x? 
的 逻辑 问题 (将 零 假 设 模型 完全 拟 合作 为 想 要 证 明 的 假设 ), 设置 新 的 零 假 设 (模型 误 设 大 于 一 
个 可 以 容忍 的 小 正 数 ) 和 备 择 假 设 (模型 误 设 不 大 于 可 容忍 误 设 )。 在 此 基础 上 , 提出 与 之 相 适 
应 的 拟 合 指 数 RMSEAt 和 CF. 与 传统 RMSEA 和 CFI 不 同 , RMSEA: FI CFI 具有 推断 统计 
PE. DA RMSEA 为 例 ， 它 表示 模型 误 设 的 大 小 不 超过 RMSEA,， 且 做 出 这 一 推断 犯错 误 的 
概率 不 超过 显著 性 水 平 a。 

男 外 ,对 于 近年 来 受到 关注 的 BSEM, 有 专门 的 拟 合 评价 指标 : (1) 后 验 预测 p 值 (posterior 
predictive p value, ppp)。 它 反映 观测 数据 拟 合 函数 和 基于 后 验 分 布 的 样本 数据 拟 合 函数 间 的 
差距 ( 梁 莘 娅 ， 杨 艳 云 , 2016)， 近 似 0.5 表示 模型 拟 合 良好 ， 接 近 0 或 1 表示 拟 合 不 佳 。(2) 
贝 叶 斯 因子 (Bayes factors)。 可 粗略 地 理解 为 当前 数据 对 两 个 竞争 模型 支持 强度 的 比值 。 经 
验 上 ， 两 个 竞争 模型 的 贝 叶 斯 因子 大 于 10， 表 示 有 较 强 证 据 支 持 贝 叶 斯 因子 分 子 所 代表 的 
模型 ， 贝 叶 斯 因子 小 于 110， 表 示 有 较 强 证 据 支持 贝 叶 斯 因子 分 母 所 代表 的 模型 ( 胡 传 鹏 等 ， 
2018); 贝 叶 斯 因子 在 1/3~3 之 间 ， 表示 数据 对 两 个 模型 的 支持 力度 差不多 ( 张 沥 今 等 , 2019)。 

量 相 较 于 贝 叶 斯 因子 ， 具 备 计算 量 更 小 ， 且 对 先 验 信息 依赖 更 少 的 优点 。 工 ， 
越 小 的 模型 拟 合 越 好 。 李 云 仙 等 的 系列 论文 详细 介绍 了 工 , 的 统计 原理 ， 并 将 其 用 于 带 有 有 
序 变量 和 缺失 数据 的 SEM 及 两 水 平 SEM 的 模型 选择 ( 李 云 仙 , 王 学 仁 , 2011, 2012; 李 云 仙 ， 


(3)L,。 该 统计 


杨 爱 军 , 2014)。(4) 贝 叶 斯 信息 指数 (Bayesian information criterion, BIC) 和 异常 信息 指数 


(deviance information criterion, DIC)。 这 两 个 指标 均 只 用 于 模型 比较 , 数值 越 小 表示 模型 拟 合 
越 好 。 


12 


此 外 ， 当 数据 不 服从 正 态 分 布 ， 有 研究 提出 用 Satorra-Bentler 校正 ?评价 模型 拟 合 ( 刘 小 
其 等 , 2013)。 金 勇 进 和 梁 燕 (2005) 介 绍 了 适用 于 基于 PLS 的 SEM 的 拟 合 评价 指标 ， 包 括 因 
子 共同 度 、R2( 外 生 潜 变量 对 内 生 湾 变量 的 预测 效果 )、 元 余 (由 外 生 潜 变量 所 解释 的 内 生 潜 变 
量 测量 指标 平均 方差 ) 等 。 

4.2 拟 合 指数 的 临界 值 


针对 常用 拟 合 指数 CFI、TLI、RMSEA 和 SRMR ,一 般 认为 ,CFI 和 、TLI 不 低 于 0.9(Bentler 


& Bonett, 1980), RMSEA 和 SRMR 不 高 于 0.08 时 (Browne & Cudeck, 1992), 模型 可 以 接受 。 


但 也 有 研究 者 建议 使 用 更 高 的 标准 : CFI 和 TLI 不 低 于 0.95、RMSEA 和 SRMR 不 高 于 0.05 
(Hu & Bentler, 1999)， 现 在 通常 将 这 一 较 严 奇 的 标准 作为 模型 拟 合 优秀 的 标准 。 此 类 临界 标 
准 只 是 一 种 基于 经 验 的 约定 俗 成 的 判断 。 

有 研究 者 通过 设计 一 些 特殊 的 真 模型 和 错误 模型 展开 模拟 研究 , 根据 各 拟 合 指数 采取 不 
同 临界 值 时 两 类 错误 率 之 和 来 确定 不 同 条 件 下 最 佳 的 拟 合 临界 值 ( 郭 庆 科 等 , 2007, 2008)。 然 
而 ， 真 模型 与 错误 模型 的 差距 复杂 多 样 ， 拟 合 最 佳 临界 值 会 随 这 一 差距 的 变化 而 改变 ， 有 文 
献 指 出 这 种 通过 模拟 研究 确定 固定 临界 值 的 做 法 是 不 恰当 的 ( 温 忠 麟 ， 侯 杰 泰 ,2008; Marsh 


et al., 2004). 
43 拟 合 指数 的 选用 

由 于 存在 诸多 拟 合 指数 可 供 使 用 ， 需 要 考虑 选择 报告 哪些 指数 。 王 长 义 等 2010) 通 过 总 
结 和 分 析 已 有 的 拟 合 指数 性 能 评估 研究 , 认为 TLI 和 RMSEA 是 最 值得 信赖 的 拟 合 指数 , 不 
过 CFI、RNI、Mc、SRMR 和 x2/df 也 有 一 定 参 考 价 值 。 还 有 研究 者 通过 分 析 拟 合 指 数 的 公式 ， 
rr 发 现 除 了 理论 模型 不 优 于 独立 模型 ( 即 只 有 显 变量 且 互 不 相关 的 模型 ) 的 极端 情况 ， 
CFI>TLIQHIK, ZERI W, 2015). PTL, = TLI 可 以 接受 ，CFI 就 是 多 余 的 。 而 且 ，CFI 不 惩 
罚 复 杂 模 型 ( 温 忠 麟 等 , 2004)， 当 几 个 模型 都 能 拟 合 数据 时 ， 无 法 帮助 研究 者 选 出 更 简洁 的 
模型 。 这 样 ， 研 究 者 选择 报告 TLI、RMSEA 和 SRMR 即 可 。 
4.4 其 它 模型 评价 标准 

应 用 研究 者 往往 将 拟 合 指数 作为 最 重要 甚至 唯一 的 模型 评价 标准 。 很 多 文献 对 此 做 法 提 
出 批评 。 一 方面 ， 每 种 指数 都 只 是 从 一 个 特定 角度 评价 拟 合 ， 有 其 固有 局 限 ( 王 阳 等 , 2020)。 
另 一 方面 ， 拟 合 指数 普遍 受 模型 拟 合 程度 之 外 的 其 它 因 素 影响 ， 如 样本 容量 、 数 据 分 布 、 
子 载荷 、 参 数 估计 方法 等 ( 王 阳 等 , 2020; WEE, 2008; Shi & Maydeu-Olivares, 2020)。 所 
以 评价 模型 拟 合 有 必要 参考 其 它 标准 ， 如 参数 估计 评价 、 整 体 拟 合 、 内 部 拟 合 及 复核 效 度 检 


验 等 ( 侯 杰 泰 等 , 2004; 温 忠 麟 等 , 2004, 2008; XA, RXZ, 2014). 


=, 
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首先 , 可 考察 参数 估计 过 程 是 否 正常 收敛 。 出 现 识别 或 收敛 问题 往往 是 因为 模型 设 定 不 
合理 。 然 后 检查 4 个 方面 内 容 : (1) 模 型 参数 符号 是 否 恰当 、 是 否 统计 显著 ? 不 显著 考虑 修 
改 ( 侯 杰 泰 等 , 2004)。(2)R2 是 否 足够 大 ? 对 于 测量 模型 ， 太 小 的 到 说 明 载 荷 太 低 ， 意 味 着 条 
目 信 和 度 过 低 ( 温 忠 麟 等 , 2008)。 不 少 研 究 发 现 拟 合 指数 倾向 于 支持 信 度 更 低 的 模型 (如 Greiff 
& Heene, 2017)， 所 以 需要 同时 权衡 拟 合 指数 和 信 度 。(3) 残 差 矩 阵 有 无 异常 元 素 ( 温 忠 鹿 等 ， 
2008)， 太 大 的 残 差 绝对 值 意味 着 理论 模型 和 数据 有 明显 差距 。(4) 哪 些 路 径 或 载荷 有 较 大 的 
修正 指数 ( 侯 杰 泰 等 ,2004)? 过 大 的 修正 指数 意味 着 模型 中 的 箭头 可 能 指 错 了 位 置 。 看 拟 合 
指数 之 前 先 分 析 这 些 与 参数 估计 有 关 的 评价 指标 可 以 提升 对 误 设 模型 的 检验 力 ( 温 忠 膀 等 ， 
2008; XX, RŽ, 2014)。 

参数 估计 评价 之 后 , 才 看 拟 合 指数 。 拟 合 指数 是 对 模型 整体 拟 合 情 况 的 评价 。 除 此 之 外 ， 
还 可 以 考察 模型 内 部 拟 合 ， 即 从 模型 的 内 在 质量 评价 每 个 潜 变 量 的 设置 是 否 恰当 ( 郑 文 知 ， 
RXZ, 2014)。 主 要 包括 (1) 检 查 测 量 工 具 信 度 ， 可 以 使 用 CFA 计算 合成 信和 度 ;，(2) 检 查 测量 
工具 效 度 ， 包 括 内 容 效 度 、 效 标 关 联 效 度 和 结构 效 度 。 

此 外 ， 还 可 以 考察 复合 效 度 ( 即 交叉 验证 )， 将 数据 一 分 为 二 ， 用 样本 一 (校正 样本 ) 估 计 
参数 , 然后 将 这 些 参数 赋 给 样本 二 , 并 查看 其 拟 合 。 还 可 以 对 比 两 个 样本 所 得 结果 的 差异 ( 郑 

XE, SCR, 2014)。 理 想 情况 是 两 个 样本 所 得 拟 合 都 比较 好 且 接 近 
4.5 模型 比较 和 选择 的 策略 

对 于 同一 批 数 据 , 能 够 良好 拟 合 的 模型 可 能 不 止 一 个 , 此 时 需要 通过 比较 多 个 模型 的 拟 
合 来 选择 最 优 模型 。 柳 恒 超 等 (2007 介绍 了 嵌 套 模型 的 概念 和 特点 及 嵌 套 模型 和 非 嵌 套 模 型 
的 比较 和 选择 方法 。 对 于 符 套 模型 ， 他 们 建议 比较 5 个 模型 : 独立 零 模型 Mn、 饱 和 模型 

、 感 兴趣 的 理论 模型 Mt， 以 及 两 个 其 次 感 兴趣 的 理论 模型 Mc 和 Mu。 首先 用 Ma 的 X2( 最 
小 x 和 Mn 的 自由 度 (最 大 自由 度 ) 进 行 闻 检 验 ， 如 果 统 计 显著 ， 则 所 有 模型 都 不 可 接受 ， 如 
果 不 显著 , 则 通过 各 模型 间 的 差异 检验 寻找 最 优 模型 。 对 于 非 嵌 套 模型 ， 一 般 建议 比较 期 


望 交 叉 验 证 指数 (expected cross-validation index, ECVD 和 Akaike 信息 指数 (Akaike information 


criterion, AIC)， 这 两 个 指数 越 小 的 模型 越 好 。 骆 方 和 张 厚 涌 (2006) 以 创造 性 思维 测验 为 例 ， 
演示 了 如 何 根 据 交 差异 检验 和 模型 的 简洁 性 来 比较 和 选择 最 佳 CFA 模型 。 此 外 ,， 郭 邯 (2005) 
了 如 何在 非 线 性 SEM 中 利用 贝 叶 斯 因子 选择 最 佳 模型 。 


DS 


5 多 组 测量 模型 (测量 不 变性 ) 
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测量 不 变性 (measurement invariance) 是 指 SEM 在 不 同 群 体 或 时 间 有 相同 结构 及 参数 值 ， 
一 般 涉及 到 检验 模型 形态 、 因 子 载荷 、 截 距 项 、 因 子 与 误差 的 方差 - 协 方差 及 潜 均 值 不 变性 ( 潜 
均值 比较 涉及 均值 结构 模型 ， 是 SEM 的 特殊 形式 之 一 ; 侯 杰 泰 等 , 2004)。 国 内 大 部 分 有 关 
测量 不 变性 的 方法 文献 侧重 于 介绍 测量 不 变性 要 检验 的 各 种 模型 检验 流程 及 模型 评价 标准 
(例如 : ARTIC, PRR, 2004; 刘 军 , 2005; 刘 军 ， 吴 维 库 , 2005; 刘 砚 燕 ， 袁 长 蓉 , 2015; BLE 
建 ， 郑 广 文 , 2015; RIS, IKAW, 2011; 武 淑琴 等 , 2009; FER, 2010; 张 连 生 等 , 2012; 
赵 必 华 , 2007; 郑 广 文 等 , 2014)。 此 外 ， 还 有 两 个 测量 不 变性 的 研究 方向 受到 关注 。 第 一 
特定 模型 或 数据 中 如 何 实现 测量 不 变性 分 析 。 如 郑 显 亮 等 2011) 介 绍 了 二 阶 因子 模型 的 测 生 
不 变性 分 析 方法 。 其 与 传统 测量 不 变性 分 析 的 主要 差别 在 于 , 各 项 不 变性 约束 都 要 分 别 在 一 
阶 和 二 阶 水 平 上 进行 设 定 。 李 冲 和 刘 红 云 (2011) 建 议 在 进行 等 级 数据 的 测量 不 变性 分 析 时 ， 
使 用 WLSMV 估计 参数 ,并 以 基于 WLSMYV 的 校正 ? 差 值 检验 法 (correct chi-square difference 
test, DIFFTEST) 比 较 峙 套 模型 。 他 们 的 模拟 研究 表明 ，WLSMYV 对 因子 载荷 和 闽 值 参数 的 估 
计 准 确 性 高 ，DIFFTEST 的 两 类 错误 率 也 可 以 接受 ( 李 冲 , 刘 红云 , 2011)， 且 这 些 方法 的 表现 
并 不 逊 于 基于 项 目 反应 理论 的 方法 ( 刘 红 云 , 李 冲 等 , 2012)。 

第 二 方面 ， 测 量 不 变性 分 析 中 ， 不 少 约束 模型 太 过 严格 ， 不 易 实 现 ( 温 聪 聪 等 , 2019)。 
研究 专门 讨论 这 一 问题 。 比如, 当 形 态 不 变性 和 载荷 不 变性 成 立 , 但 截 距 不 变性 未 能 满足 ， 
如 果 研 究 者 还 想 比 较 潜 均值 ， 可 以 采用 投影 法 ( 王 阳 等 , 2020; Deng & Yuan, 2016)。 该 法 将 每 
个 组 的 显 变量 均值 分 解 为 两 个 正 交 的 成 分 ， 公 分 数 (代表 潜 均 值 ) 和 特殊 因子 。 这 两 个 成 分 的 
跨 组 不 变性 分 析 都 不 依赖 截 距 项 ， 从 而 使 潜 均 值 比较 可 以 直接 绕 过 截 距 不 变 这 一 传统 前 提 。 

如 果 只 有 形态 不 变性 成 立 , 但 之 后 的 不 变性 约束 模型 拟 合 不 佳 ， 建 议 采 用 对 齐 法 , 构建 
一 个 反映 各 组 截 距 和 载荷 差 值 的 损失 函数 ， 并 求 取 使 损失 函数 最 小 的 载荷 与 截 距 估计 值 。 此 
时 ,约束 模型 中 各 组 对 应 参数 虽然 不 完全 相等 , 但 足够 接近 ; 而 且 ， 该 模型 与 形态 不 变 模 型 
有 相同 的 拟 合 度 。 对 齐 法 可 以 视 为 一 种 近似 不 变性 模型 。 该 法 的 具体 原理 、 应 用 实例 和 Mplus 

语句 参见 温 聪 聪 等 (2019)。 此 外 ， 最 近 也 有 研究 者 建议 利用 BSEM 分 析 测 量 不 变性 。 通 过 给 

要 检验 的 参数 设置 均值 为 0 且 方 差 极 小 的 先 验 分 布 , 达到 放宽 参数 跨 组 不 变 限 制 , 实现 近 
似 不 变性 分 析 的 目的 ( 宋 琼 雅 等 , 2021)。 
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6 结构 方程 模型 中 的 特殊 数据 处 理 
说 的 特殊 数据 处 理 主要 包括 缺失 数据 、 非 连续 数据 、 非 正 态 数据 及 潜 变量 得 分 等 。 
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6.1 SEM 中 的 数据 缺失 问题 
SEM 建 模 时 如 果 缺 失 数据 过 多 ， 可 能 导致 模型 估计 出 现 问题 (如 协 方差 矩阵 非 正 定 ; 林 
小 鹏 等 , 2010)。 推 荐 好 的 缺失 数据 填补 方法 及 对 比 不 同方 法 的 效果 是 重要 的 研究 工作 。 方 法 


荐 方面 ， 多 重 填补 法 (multiple imputation, MI) 和 全 信息 极 大 似 然 估 计 法 (full information 


maximum likelihood, FIML) 是 目前 最 为 研究 者 所 推崇 的 缺失 处 理 方法 ( 王 雷 成 , 邓 俏 文 ， 
2016)。MI 对 缺失 数据 进行 多 次 填补 ， 用 每 个 填补 后 的 完整 数据 集 进行 分 析 从 而 获得 目标 参 
数 的 多 个 估计 值 ， 最 后 将 多 个 估计 值 进行 汇总 获得 最 终 参 数 估计 值 ，FIML 则 不 对 缺失 值 进 
行 蔡 换 ， 而 是 根据 未 缺失 数据 的 信息 采用 从 代 的 方式 进行 估计 。MI 优势 包括 充分 考虑 了 数 
据 的 不 确定 性 、 能 更 灵活 地 处 理 同 时 包含 连续 和 非 连续 变量 的 混合 数据 (Mansolf et al., 
2020); 不 足 在 于 MI 的 分 析 过 程 更 复杂 ， 耗 时 更 长 ( 叶 素 静 等 , 2014)。FIML 的 主要 优势 是 操 
作 简 便 ( 王 孟 成 ， 邓 俏 文 , 2016)， 不 足 是 有 时 会 遇 到 第 一 类 错误 率 偏 高 及 模型 收敛 问题 


(Mansolf et al., 2020). 

方法 比较 方面 , 杨 林山 和 曹 亦 税 (2012) 模 拟 比 较 了 完全 贝 叶 斯 法 (将 缺失 数据 视 为 未 知 参 
数 ， 通 过 模拟 全 体 变 量 与 缺失 值 的 联合 后 验 分 布 来 估计 模型 参数 和 缺失 值 ) 和 部 分 贝 叶 斯 法 
(相当 于 贝 叶 斯 估计 时 忽略 缺失 ) 处 理 LGM 中 缺失 数据 的 效果 。 结 果 发 现 缺 失 比例 超过 50% 
时 ， 前 者 的 均 方 误差 明显 小 于 后 者 ， 即 参数 估计 精度 更 高 ;而 缺失 比例 较 小 时 ， 二 者 效果 接 
近 。 陈 楠 和 刘 红 云 2015) 模 拟 比 较 了 ML 和 Diggle-Kenward 选择 模型 这 两 种 方法 处 理 LGM 


中 非 随 机 缺失 的 效果 ， 总 体 上 后 者 效果 更 好 。 邓 居 敏 等 (2018) 用 一 个 实证 数据 比较 了 列 删 法 


= 


(listwise deletion). 期望 最 大 化 算法 (expectation maximization algorithm). MI Fi FIML 处 理 SEM 
中 缺失 数据 的 效果 ， 发 现 MI 和 FML 获得 的 模型 拟 合 较 好 ， 期 望 最 大 化 算法 获得 的 参数 标 
准 误 最 小 ， 而 列 删 法 获得 的 参数 标准 误 最 大 。 王 孟 成 和 邓 俏 文 (2016) 通 过 模拟 研究 探讨 了 利 
用 FIML 处 理 SEM 数据 缺失 时 辅助 变量 的 作用 ， 总 的 来 说 纳入 辅助 变量 有 助 于 得 到 更 可 靠 
的 参数 估计 。 
6.2 SEM 中 的 非 连续 及 非 正 态 数 据 问题 

社 科 研究 中 所 用 的 问卷 数据 经 常 是 有 序 分 类 的 , 直接 将 其 作为 连续 变量 建 模 可 能 会 降低 
参数 估计 精度 和 模型 拟 合 ， 高 静 (2012) 提 出 了 一 个 有 序 分 类 数据 的 连续 化 处 理 程序 ， 并 通过 
应 用 示例 展示 了 这 种 方法 对 模型 拟 合 的 提升 。 

方 敏和 黄 正 峰 (2010) 介 绍 了 非 正 态 数据 的 常用 SEM 建 模 方法 ， 推 荐 使 用 Bollen-Stine 
Bootstrap 法 校正 闪 检 验 结果 ， 并 给 出 了 Amos 操作 演示 。 


6.3 SEM 中 的 潜 变量 得 分 问题 
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张 岩 波 等 (2005) 介 绍 了 SEM 中 潜 变 量 得 分 的 估计 原理 ， 并 用 LISREL 演示 了 潜 变 量 得 
分 的 计算 。 刘 表 和 刘 红 云 2017) 介 绍 了 双 因 子 模型 中 全 局 因子 和 局 部 因子 的 加 权 因 子 分 计算 
方法 ， 模 拟 研究 表明 相对 于 其 它 测验 总 分 和 维度 分 的 合成 方法 ， 加 权 因子 分 最 接近 真 分 数 ， 
信和 度 最 高 。 此 外 ， 张 洁 婷 等 (2012) 介 绍 了 潜 变 量 数据 类 型 的 确定 方法 。 


7 其 它 议 题 

除 上 述 5 大 主题 ， 国 内 SEM 方法 研究 还 有 一 些 值得 关注 的 主题 ， 包 括 传统 统计 和 测量 
方法 如 何 纳入 SEM 框架 、 对 误差 相关 问题 的 讨论 、SEM 建 模 步 又 的 改进 、SEM 检验 力 分 
析 等 。 

鉴于 SEM 的 诸多 优势 及 其 与 其 它 统计 方法 的 兼容 性 ， 有 研究 者 介绍 了 传统 统计 和 测量 
方法 与 SEM 的 结合 方法 , 以 提升 分 析 准 确 性 和 建 模 灵活 性 。 如 基于 CFA 模型 的 信 度 计算 ( 见 


温 忠 鹿 ， 方 太 ， 陈 虹 喜 等 , 2022)、 基 于 SEM 的 各 类 中 介 模 型 ( 见 温 忠 麟 , 方 杰 , 谢晋 艳 等 , 2022) 


与 调节 模型 (见方 杰 等 , 2022)、 基 于 SEM 的 多 水 平 模型 ( 毕 向 阳 , 2019; 方 杰 等 , 2011; 张 岩 波 


等 , 2006; 张 岩 波 等 , 2008)、 基 于 SEM 的 元 分 析 ( 桂 裕 亮 等 , 2016; 钱 刘 兰 等 , 2015), EF SEM 


的 时 间 序 列 分 析 ( 朱 苗 苗 , 2016)、 基 于 SEM 的 人 工 神经 网 络 模型 ( 颜 波 等 , 2019; 赵 海峰 ， 万 


HG, 2003)、 基 于 SEM 的 条 目 因 子 分 析 (item factor analysis， 吴 瑞 林 ， 涂 冬 波 , 2013)、 基 于 
SEM 的 指标 体系 ( 即 为 抽象 概念 建立 的 带 权 重 、 分 层级 的 测量 指标 系统 ; 页 新 明 , 2011; 斯 介 
生 等 , 2014; 田 飞 , 2007; EEX, Ae, 2004; 俞 立 平 , 2020; 张 瑛 ， 王 惠 文 , 2008)、 基 于 
SEM 的 模糊 综合 评价 算法 ( 庄 伟 狠 , 刘 震 宇 , 2013)、 基 于 SEM 的 隐 马 尔 可 夫 模 型 ( 王 坤 等 ， 


© 2018; 夏 业 茂 等 , 2019) 及 基于 双 因 子 模型 的 计算 机 自 适 应 测验 ( 刘 志 婷 等 , 2019; 毛 秀 珍 等 ， 


2019; 毛 秀珍 等 , 2018)。 
通常 SEM 中 如 无 充分 理据 ， 不 应 设 定 测 量 误差 相关 。 当 误差 项 之 间 存 在 系统 性 相关 来 
源 时 ， 可 以 设 定 误 差 相 关 ， 如 相同 方法 测量 的 条 目的 误差 、 同 一 条 目的 多 次 重复 
设 定 为 相关 是 合理 的 。 另 外 ， 当 模型 存在 多 个 较 大 的 误差 相关 修正 指数 ， 可 以 通过 增设 潜在 
共同 方法 因子 来 解释 误差 相关 ( 胡 鹏 等 , 2018)。 
针对 SEM 建 模 过 程 中 不 恰当 的 模型 设 定 可 能 降低 模型 拟 合 的 问题 ， 陈 明亮 (2004) 提 出 
改进 SEM 的 建 模 步骤, 主要 是 增加 识别 和 剔除 不 恰当 问卷 条 目 ( 与 所 测 变量 相关 偏 低 或 与 其 
它 条 目 相关 过 大 的 条 目 ) 及 相关 性 过 强 的 变量 , 并 重新 评估 测量 模型 和 结构 模型 拟 合 的 步骤 。 
安 敏 (2016) 总 结 了 SEM 中 检验 力 分 析 的 常用 方法 ， 并 以 师 生 关系 问卷 为 例 说 明了 如 何 


一 


测量 的 误差 
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用 Mplus 进行 检验 力 分 析 。 王 惠 文 和 张 瑛 (2007) 介 绍 了 SEM 的 后 推 预测 算法 ， 即 如 何 根据 
变量 当前 形成 的 SEM 预测 未 来 变量 间 的 关系 ， 并 通过 模拟 研究 支持 了 该 算法 的 预测 效果 。 

单 娜 和 张 笑 笑 (2020) 通 过 数学 推导 , 给 出 了 因 变 量 和 协 变 量 (同时 影响 自 变 量 和 因 变 量 的 无 关 
变量 ) 均 为 潜 变 量 ， 而 自 变 量 是 显 变量 时 ， 平 均 因果 效应 的 计算 方法 。 贾 新 明和 刘 亮 (2008) 
从 变量 、 样 本 、 数 据 、 参 数 估计 和 模型 解释 几 个 方面 比较 了 SEM 与 联 立 方程 模型 的 异同 点 。 


8 讨论 与 拓展 
新 世纪 二 十 年 来 ，SEM 得 到 越 来 越 多 社会 学 科 的 重视 和 应 用 ， 这 也 带动 了 SEM 方法 和 
究 的 发 展 。 在 国内 ， 十 余 个 不 同学 科 为 SEM 方法 研究 做 出 了 贡献 ， 在 5 个 主题 上 有 较 多 的 


= 研究 成 果 。2020 年 后 的 一 年 内 , 仅 在 追踪 研究 中 的 SEM 这 一 个 方向 , 就 增加 了 多 篇 文献 ( 方 


俊 燕 等 ， 印 刷 中 ; 高 文 阳 等 , 2021; 刘 源 , 2021; UMMAH, 朱红 , 2021; Fee, 2021; 郑 舒 方 等 ， 


KANY 


2021). RARS E 


RXUDR (2022), KEDHER. HERE ATI, WARE, eA BATT 
法 进展 ( 宋 琼 雅 等 , 2021)。 为 了 更 好 地 对 SEM 的 当下 研究 有 所 了 解 ， 这 里 也 介绍 一 些 国外 较 
新 的 SEM 方法 学 研究 ， 可 以 发 现 一 些 值 得 国内 方法 学 者 未 来 探索 和 拓展 的 方向 。 

8.1 原 有 主题 的 拓展 


在 模型 的 发 展 方面 , 简要 介绍 双 因 子 ESEM 和 SEM 树 。 尽 管 双 因子 模型 和 ESEM 各 自 
克服 了 传统 CFA 的 一 些 重要 局 限 ， 但 也 都 有 不 足 ， 前 者 忽视 了 跨 因子 载荷 普遍 存在 的 事实 ， 
可 能 使 因子 相关 被 高 估 ; 后 者 则 忽视 了 高 阶 因 子 存在 的 可 能 性 ， 容 易 导致 跨 因 子 载荷 偏 高 。 
将 双 因子 模型 和 ESEM 结合 起 来 的 双 因 子 ESEM 很 好 地 弥补 了 两 种 模型 独立 使 用 时 的 局 限 


© (Morin et al., 2016). 


SEM 树 是 SEM 和 决策 树 的 结合 ， 可 以 根据 研究 者 选 定 的 预测 变量 (如 儿童 的 运动 技能 、 
学 习 方式 和 生活 常识 等 ) 为 某 一 结果 变量 或 结果 变量 的 变化 轨迹 (如 儿童 阅读 能 力 的 发 展 轨 
迹 ) 进 行 分 类 。 当 存在 很 多 有 价值 的 预测 变量 、 预 测 变 量 间 普遍 存在 交互 作用 或 对 分 类 的 个 


数 缺 乏 先 验 知识 时 , SEM 树 被 认为 是 有 限 混合 模型 ( 即 LCM、 LPM, LCGM、GMM 及 PGMM 


这 一 类 方法 ) 的 良好 蔡 代 (Jacobucci et al., 2017). 


在 参数 估计 方法 方面 , 简要 介绍 模型 存在 误 设 时 参数 估计 精确 度 研 究 的 进展 及 参数 估计 
不 确定 性 的 评价 。Lai 和 Zhang(2017) 通 过 模拟 比较 研究 发 现 ， 对 于 CFA 模型 ，ML 在 模型 


有 较 严 重 误 设 时 仍 可 以 提供 可 靠 参 数 点 估计 ; 但 对 于 完整 的 SEM， 当 误 设 较 大 时 ， 各 类 参 


数 估计 方法 的 偏差 都 比较 大 。Pek 和 Wu(2018) 提 出 的 可 蔡 换 参数 估计 (fungible parameter 
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estimates) 评 价 了 SEM 参数 估计 无 关 抽样 变异 的 敏感 性 。 
在 模型 评价 方面 , 简要 介绍 一 些 拟 合 指数 (包括 局 部 拟 合 检验 和 BSEM 的 拟 合 指数 ) 及 临 
界 值 的 新 动态 。 传 统 的 拟 合 指数 只 用 于 评价 模型 整体 ，Thoemmes 等 (2018) 提 出 的 局 部 拟 合 
检验 为 模型 的 不 同 部 分 分 别提 供 拟 合 评 价 , 有 助 于 定位 模型 误 设 的 来 源 ,， 即 使 模型 未 识别 或 
不 收敛 ， 依 然 可 以 使 用 。 

随 着 BSEM 的 流行 ， 如 何 评价 它 的 拟 合 优 度 成 为 一 个 重要 问题 。BSEM 使 用 的 拟 合 评 
价 指标 并 不 是 研究 者 所 熟悉 的 传统 拟 合 指数 ， 而 且 大 多 只 用 于 模型 比较 (如 贝 叶 斯 因子 和 异 
常 信息 指数 )。Garnier-Villarreal 和 Jorgensen(2020) 用 参数 后 验 均 值 取代 ?构建 了 基于 BSEM 


的 RMSEA、CFI 和 TLI 等 7 个 新 拟 合 指数 。 
对 于 临界 值 的 划分 , McNeish 和 Wolf2021) 提 出 了 一 种 基于 数据 模拟 技术 的 动态 拟 合 指 
数 (dynamic fit index) 临 界 值 ， 这 种 临界 值 考虑 到 了 影响 模型 拟 合 的 各 种 模型 和 数据 特征 因 
素 ， 可 以 有 效 地 拒绝 误 设 模型 。 
在 测量 不 变性 分 析 方 面 ， 通 过 定义 新 的 条 目 功能 差异 (differential item functioning, DIF) 
或 将 不 变性 问题 看 成 是 有 关 模 型 参数 的 聚 类 或 调节 问题 , 可 以 从 新 的 不 同 角 度 阐 释 跨 组 测量 


不 变性 (Bauer 2017; De Roover et al, 2020; Schulze & Pohl, 2021). 
此 外 ， 还 有 特殊 数据 的 SEM 的 拓展 ， 涉 及 Logistic MIKA. 44 Ce AS oT 
等 非 连续 数据 的 SEM 建 模 方法 (Asparouhov & Muthén, 2021)、 小 样本 数据 建 模 相关 的 研究 


(Jiang & Yuan, 2017; Smid & Winter, 2020). 
8.2 开拓 新 主题 

SEM 领域 新 的 主题 不 断 涌现 ， 例 如 ， 以 探索 为 目的 的 SEM、 基 于 实验 研究 的 SEM、 工 
具 变 量 (instrumental variables) 在 SEM 中 的 使 用 及 SEM 软件 包 的 开发 等 。 

SEM 绝 大 多 数 应 用 都 是 验证 性 质 的 ， 但 是 对 于 包含 海量 数据 的 大 型 研究 ， 可 能 需要 在 
缺乏 预先 假设 的 前 提 下 探索 多 个 前 因 变 量 中 哪些 是 有 实际 作用 的 。 这 种 探索 视角 下 的 SEM 
可 以 用 正则 化 方法 (Regularization) 来 实现 。 正 则 化 SEM 通过 给 拟 合 函 数 增加 一 个 惩罚 项 或 
给 参数 设 定 特殊 的 先 验 (如 小 方差 的 跨 因 子 载荷 先 验 )， 将 偏 小 的 系数 缩减 到 0， 从 而 起 到 变 


量 或 路 径 盘 选 的 作用 (Jacobucci et al., 2016; Lu et al., 2016; Muthén & Asparouhov, 2012; Pan et 


al., 2017). 
近年 来 国外 不 少 方法 文献 将 实验 研究 中 的 传统 统计 方法 与 潜 变 量 建 模 思路 相 结合 , 形成 
了 基于 实验 研究 的 潜 变 量 建 模 方法 。 例 如 ，Breitsohl(2019) 比 较 了 被 试 间 方 差分 析 和 两 种 基 


于 SEM 的 方法 : 结构 均值 模型 (structured-means-modeling) 和 多 指标 多 因 模 型 
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(multiple-indicator multiple-cause)。 两 种 SEM 方法 都 将 因 变 量 表示 为 潜 变 量 ， 区 别 是 结构 均 
值 模型 同时 给 每 个 实验 处 理 对 应 的 因 变 量 建 模 并 比较 潜 均 值 , 而 多 指标 多 因 模 型 是 直接 建立 
潜 因 变量 对 操纵 变量 的 回归 。 又 如 ，Langenberg 等 (2020) 提 出 的 潜 重 复 测量 方差 分 析 (latent 
repeated measures analysis of variance) 将 单 指标 显 性 结果 变量 蔡 换 为 多 指标 潜 变 量 , 提升 了 主 
效应 和 交互 效应 的 检验 力 , 放松 了 有 关 缺 失 和 残 差 结构 的 假设 ,并 能 通过 测量 不 变性 分 析 验 
证 强 不 变性 是 否 满足 。 
工具 变量 是 研究 者 不 感 兴趣 但 能 够 解释 预测 变量 内 生性 ( 即 预测 变量 与 模型 残 差 相关 )， 

且 与 模型 残 差 无 关 的 变量 。 通 过 使 用 工具 变量 , 将 预测 变量 分 解 为 与 残 差 无 关 的 外 生 部 分 及 
与 残 差 相关 的 内 生 部 分 , 仅 使 用 外 生 部 分 估计 感 兴趣 的 路 径 系 数 。 这 样 可 以 解决 内 生性 问题 ， 
获得 对 模型 系数 更 准确 的 估计 ， 从 而 提升 SEM 的 因果 推断 能 力 (Maydeu-Olivares et al., 


NI 


2020). 


Al 


4 SEM 有 很 多 专用 软件 (如 Amos. EQS, LISREL 和 Mplus)， 但 传统 软件 也 有 一 些 
局 限 ， 且 很 多 新 提出 的 前 沿 方法 尚 不 能 很 快 纳入 传统 软件 中 。 此 时 ， 研 究 者 自己 开发 的 软件 
包 就 对 改进 传统 软件 局 限 和 推动 新 方法 应 用 起 到 重要 作用 。 有 不 少 方法 文献 致力 于 介绍 新 开 


发 的 SEM 软件 包 。 例 如 ，Gonzales(2021)，Rosseel(2012)，Igolkina 和 Meshcheryakov(2020) 


分 别 介绍 了 综合 性 的 SEM 软件 包 JMP Pro, lavaan 和 semopy, Jiang 等 (2017) 介 绍 了 等 效 性 


检验 软件 包 equaltestMI, Zhang 等 (2021) 介 绍 了 CFA 模型 修正 软件 包 blcfa。 


对 于 SEM 的 前 沿 方法 ， 国 内 期 刊 文献 的 工作 大 多 数 属于 跟踪 、 介 绍 或 评论 、 整 合 ， 缺 
乏 对 这 些 方法 统计 学 性 质 的 深入 研究 。 一 方面 ， 对 方法 之 间 的 联系 认识 不 够 。 少 有 研究 试图 
厘清 竞争 方法 之 间 的 数理 关联 (如 方 俊 燕 等 ,印刷 中 ; 温 涵 , 梁 韵 斯 ,2015)， 如 哪些 方法 是 近 
似 甚至 等 价 的 ， 或 通过 怎样 的 变化 ， 不 同方 法 可 以 相互 转化 。 而 此 类 研究 在 国外 并 不 鲜 见 
(Serang et al., 2019; Usami et al., 2015, 2019; Yuan & Deng, 2021). 此 类 分 析 有 助 于 加 深 研 究 者 
对 方法 的 全 面 理解 和 融会 贯通 。 另 一 方面 ， 方 法 之 间 比 较 的 模拟 研究 也 不 多 。 比 如 有 关 拟 合 
指数 的 模拟 研究 国外 从 未 间断 ， 既 有 模拟 研究 探究 各 种 非 拟 合 因素 (如 参数 估计 方法 和 信 度 ) 


寸 拟 合 指数 估计 的 影响 (McNeish et al., 2018; Shi & Maydeu-Olivares, 2020)， 也 有 研究 比较 新 


>4 


拟 合 指数 和 流行 拟 合 指数 的 优 劣 (Counsell et al., 2020; Garnier-Villarreal & Jorgensen, 2020). 


尽管 尚 有 不 足 ， 过 去 20 年 国内 SEM 方法 成 果 仍 为 提升 国内 量化 研究 水 平 提供 了 强大 


助力 ， 相 信 在 方法 研究 和 应 用 需求 的 相互 促进 之 下 ， 未 来 会 有 更 多 高 质量 的 SEM 方法 文献 
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出 现 。 
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Abstract: In the first two decades of the twenty-first century, the hotspots of the 
methodological research on structural equation models (SEM) in China’s mainland generally 
involve the following five aspects: model development, parameter estimation, model 
evaluation, measurement invariance and special data processing. Remarkably, there is more 
progress in model development (i.e., different variations of SEM) amongst the above aspects. 
After an overview of the background knowledge of these hotspots, we presented the main 
research topics and methodological achievements under each hotspot. We also discussed the 
recent progress of the foreign methodological studies on SEM and the future research 


directions. 
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